Cos'è tabella di contingenza?

Una tabella di contingenza, chiamata anche tabella di frequenza doppia, è una tabella che mostra la distribuzione di frequenza di due o più variabili categoriche. È uno strumento fondamentale in https://it.wikiwhat.page/kavramlar/statistica per analizzare le relazioni tra variabili qualitative.

  • Struttura: Una tabella di contingenza ha righe e colonne, dove ogni riga rappresenta una categoria di una variabile e ogni colonna rappresenta una categoria di un'altra variabile. Le celle all'interno della tabella contengono le frequenze congiunte, ovvero il numero di osservazioni che appartengono a specifiche categorie di entrambe le variabili.

  • Variabili: Le variabili coinvolte sono tipicamente https://it.wikiwhat.page/kavramlar/variabili%20categoriche (nominali o ordinali). Esempi includono genere (maschio/femmina), livello di istruzione (elementare, media, superiore, universitaria), opinioni (favorevole, contrario, neutrale) e così via.

  • Scopo: L'obiettivo principale di una tabella di contingenza è esaminare se esiste una https://it.wikiwhat.page/kavramlar/associazione tra le variabili. In altre parole, stiamo cercando di determinare se la distribuzione di una variabile è influenzata dalla distribuzione dell'altra.

  • Analisi:

    • Frequenze marginali: Sono le somme delle frequenze per riga e per colonna. Indicano la distribuzione di frequenza di ciascuna variabile presa singolarmente.
    • Frequenze condizionate: Si calcolano dividendo le frequenze congiunte per le frequenze marginali di riga o di colonna. Mostrano la distribuzione di una variabile condizionata a una particolare categoria dell'altra variabile.
    • Test del chi-quadrato: Un test statistico comune utilizzato per valutare se l'associazione osservata tra le variabili è statisticamente significativa. Il test confronta le frequenze osservate nella tabella con le frequenze attese sotto l'ipotesi di indipendenza. Un valore p basso suggerisce che c'è una significativa https://it.wikiwhat.page/kavramlar/dipendenza tra le variabili.
    • Misure di associazione: Esistono diverse misure che quantificano la forza dell'associazione tra le variabili, come il coefficiente di contingenza di Pearson, il V di Cramer, e il coefficiente phi. La scelta della misura dipende dal tipo di dati e dalla dimensione della tabella.
  • Esempio: Immaginiamo di voler studiare la relazione tra "Genere" (Maschio/Femmina) e "Preferenza di Colore" (Rosso/Blu/Verde). Una tabella di contingenza mostrerebbe il numero di maschi e femmine che preferiscono ciascun colore. L'analisi della tabella potrebbe rivelare se c'è una tendenza per un genere a preferire un colore rispetto agli altri.

In sintesi, la tabella di contingenza è uno strumento potente e versatile per l'analisi esplorativa dei dati e per la verifica di ipotesi sulla relazione tra variabili categoriche.